<!DOCTYPE html>
<html lang="en">
<head>
	<meta charset="UTF-8">
	<meta http-equiv="X-UA-Compatible" content="IE=edge">
    <meta name="viewport" content="width=device-width, initial-scale=1">
	<title>动态更新索引 | Elasticsearch: 权威指南 | Elastic</title>
    <!-- Give IE8 a fighting chance -->
    <!--[if lt IE 9]>
    <script src="https://oss.maxcdn.com/html5shiv/3.7.2/html5shiv.min.js"></script>
    <script src="https://oss.maxcdn.com/respond/1.4.2/respond.min.js"></script>
    <![endif]-->
	<link rel="stylesheet" type="text/css" href="../static/styles.css" />
</head>
<body>
<div class="main-container">
    <section id="content">
        
        <div class="content-wrapper">
            <section id="guide" lang="zh_cn">
                <div class="container">
                    <div class="row">
                        <div class="col-xs-12 col-sm-8 col-md-8 guide-section">
                            <div style="color:gray; word-break: break-all; font-size:12px;">原文地址: <a href="https://www.elastic.co/guide/cn/elasticsearch/guide/current/dynamic-indices.html" rel="nofollow">https://www.elastic.co/guide/cn/elasticsearch/guide/current/dynamic-indices.html</a>, 版权归 www.elastic.co 所有<br/>
                            英文版地址: <a href="https://www.elastic.co/guide/en/elasticsearch/guide/current/dynamic-indices.html" rel="nofollow">https://www.elastic.co/guide/en/elasticsearch/guide/current/dynamic-indices.html</a>
                            </div>
                        <!-- start body -->
                  <div class="page_header">
<b>请注意:</b><br>本书基于 Elasticsearch 2.x 版本，有些内容可能已经过时。
</div>
<div id="content">
<div class="breadcrumbs">
<span class="breadcrumb-link"><a href="index.html">Elasticsearch: 权威指南</a></span>
»
<span class="breadcrumb-link"><a href="getting-started.html">基础入门</a></span>
»
<span class="breadcrumb-link"><a href="inside-a-shard.html">分片内部原理</a></span>
»
<span class="breadcrumb-node">动态更新索引</span>
</div>
<div class="navheader">
<span class="prev">
<a href="making-text-searchable.html">« 使文本可被搜索</a>
</span>
<span class="next">
<a href="near-real-time.html">近实时搜索 »</a>
</span>
</div>
<div class="section">
<div class="titlepage"><div><div>
<h2 class="title">
<a id="dynamic-indices"></a>动态更新索引<a class="edit_me edit_me_private" rel="nofollow" title="Editing on GitHub is available to Elastic" href="https://github.com/elasticsearch-cn/elasticsearch-definitive-guide/edit/cn/075_Inside_a_shard/30_Dynamic_indices.asciidoc">edit</a>
</h2>
</div></div></div>
<p>下一个需要被解决的问题是怎样在保留不变性的前提下实现倒排索引的更新？答案是: 用更多的索引。</p>
<p>通过增加新的补充索引来反映新近的修改，而不是直接重写整个倒排索引。每一个倒排索引都会被轮流查询到—​从最早的开始—​查询完后再对结果进行合并。</p>
<p>Elasticsearch 基于 Lucene, 这个 java 库引入了 <em>按段搜索</em> 的概念。
每一 <em>段</em> 本身都是一个倒排索引，
但 <em>索引</em> 在 Lucene 中除表示所有 <em>段</em> 的集合外， 还增加了 <em>提交点</em> 的概念 — 一个列出了所有已知段的文件，就像在 <a class="xref" href="dynamic-indices.html#img-index-segments" title="一个 Lucene 索引包含一个提交点和三个段">Figure 16, “一个 Lucene 索引包含一个提交点和三个段”</a> 中描绘的那样。
如 <a class="xref" href="dynamic-indices.html#img-memory-buffer" title="一个在内存缓存中包含新文档的 Lucene 索引">Figure 17, “一个在内存缓存中包含新文档的 Lucene 索引”</a> 所示，新的文档首先被添加到内存索引缓存中，然后写入到一个基于磁盘的段，如 <a class="xref" href="dynamic-indices.html#img-post-commit" title="在一次提交后，一个新的段被添加到提交点而且缓存被清空。">Figure 18, “在一次提交后，一个新的段被添加到提交点而且缓存被清空。”</a> 所示。</p>
<div id="img-index-segments" class="imageblock">
<div class="content">
<img src="../images/elas_1101.png" alt="A Lucene index with a commit point and three segments">
</div>
<div class="title">Figure 16. 一个 Lucene 索引包含一个提交点和三个段</div>
</div>
<div class="sidebar">
<div class="titlepage"><div><div>
<p class="title"><strong>索引与分片的比较</strong></p>
</div></div></div>
<p>被混淆的概念是，一个 <em>Lucene 索引</em> 我们在 Elasticsearch 称作 <em>分片</em> 。
一个 Elasticsearch <em>索引</em> 是分片的集合。
当 Elasticsearch 在索引中搜索的时候， 他发送查询到每一个属于索引的分片(Lucene 索引)，然后像 <a class="xref" href="distributed-search.html" title="执行分布式检索"><em>执行分布式检索</em></a>
提到的那样，合并每个分片的结果到一个全局的结果集。</p>
</div>
<p>逐段搜索会以如下流程进行工作：</p>
<div class="olist orderedlist">
<ol class="orderedlist">
<li class="listitem">
新文档被收集到内存索引缓存， 见 <a class="xref" href="dynamic-indices.html#img-memory-buffer" title="一个在内存缓存中包含新文档的 Lucene 索引">Figure 17, “一个在内存缓存中包含新文档的 Lucene 索引”</a> 。
</li>
<li class="listitem">
<p>不时地, 缓存被 <em>提交</em> ：</p>
<div class="ulist itemizedlist">
<ul class="itemizedlist">
<li class="listitem">
一个新的段—​一个追加的倒排索引—​被写入磁盘。
</li>
<li class="listitem">
一个新的包含新段名字的 <em>提交点</em> 被写入磁盘。
</li>
<li class="listitem">
磁盘进行 <em>同步</em> — 所有在文件系统缓存中等待的写入都刷新到磁盘，以确保它们被写入物理文件。
</li>
</ul>
</div>
</li>
<li class="listitem">
新的段被开启，让它包含的文档可见以被搜索。
</li>
<li class="listitem">
内存缓存被清空，等待接收新的文档。
</li>
</ol>
</div>
<div id="img-memory-buffer" class="imageblock">
<div class="content">
<img src="../images/elas_1102.png" alt="A Lucene index with new documents in the in-memory buffer, ready to commit">
</div>
<div class="title">Figure 17. 一个在内存缓存中包含新文档的 Lucene 索引</div>
</div>
<div id="img-post-commit" class="imageblock">
<div class="content">
<img src="../images/elas_1103.png" alt="After a commit, a new segment is added to the index and the buffer is cleared">
</div>
<div class="title">Figure 18. 在一次提交后，一个新的段被添加到提交点而且缓存被清空。</div>
</div>
<p>当一个查询被触发，所有已知的段按顺序被查询。词项统计会对所有段的结果进行聚合，以保证每个词和每个文档的关联都被准确计算。
这种方式可以用相对较低的成本将新文档添加到索引。</p>
<div class="section">
<div class="titlepage"><div><div>
<h3 class="title">
<a id="deletes-and-updates"></a>删除和更新<a class="edit_me edit_me_private" rel="nofollow" title="Editing on GitHub is available to Elastic" href="https://github.com/elasticsearch-cn/elasticsearch-definitive-guide/edit/cn/075_Inside_a_shard/30_Dynamic_indices.asciidoc">edit</a>
</h3>
</div></div></div>
<p>段是不可改变的，所以既不能从把文档从旧的段中移除，也不能修改旧的段来进行反映文档的更新。
取而代之的是，每个提交点会包含一个 <code class="literal">.del</code> 文件，文件中会列出这些被删除文档的段信息。</p>
<p>当一个文档被 “删除” 时，它实际上只是在 <code class="literal">.del</code> 文件中被 <em>标记</em> 删除。一个被标记删除的文档仍然可以被查询匹配到，
但它会在最终结果被返回前从结果集中移除。</p>
<p>文档更新也是类似的操作方式：当一个文档被更新时，旧版本文档被标记删除，文档的新版本被索引到一个新的段中。
可能两个版本的文档都会被一个查询匹配到，但被删除的那个旧版本文档在结果集返回前就已经被移除。</p>
<p>在 <a class="xref" href="merge-process.html" title="段合并">段合并</a> , 我们展示了一个被删除的文档是怎样被文件系统移除的。</p>
</div>

</div>
<div class="navfooter">
<span class="prev">
<a href="making-text-searchable.html">« 使文本可被搜索</a>
</span>
<span class="next">
<a href="near-real-time.html">近实时搜索 »</a>
</span>
</div>
</div>

                  <!-- end body -->
                        </div>
                        <div class="col-xs-12 col-sm-4 col-md-4" id="right_col">
                        
                        </div>
                    </div>
                </div>
            </section>
        </div>
    </section>
</div>
<script src="../static/cn.js"></script>
</body>
</html>